AI资讯新闻榜单内容搜索-Scaling La

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Scaling La
大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws

大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws

大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws

大模型低精度训练和推理是大模型领域中的重要研究方向,旨在通过降低模型精度来减少计算和存储成本,同时保持模型的性能。因为在大模型研发成本降低上的巨大价值而受到行业广泛关注 。

来自主题: AI技术研报
3487 点击    2025-01-17 11:07
清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

清华、智谱团队:探索 RLHF 的 scaling laws

目前关于 RLHF 的 scaling(扩展)潜力研究仍然相对缺乏,尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。 针对这一问题,来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究,并提出了优化策略。

来自主题: AI技术研报
8198 点击    2024-12-24 14:56
Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型

Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型

Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型

12 月 2-6 日,亚马逊云科技在美国拉斯维加斯举办了今年度的 re:Invent 大会。会上,亚马逊云科技发布了相当多东西,其中之一便是新的大模型系列 Nova。说实话,这确实出乎了相当多人的意料 —— 毕竟亚马逊已经重金押注 Anthropic,似乎没有必要再自起炉灶了。

来自主题: AI资讯
6203 点击    2024-12-18 14:41
OpenAI附议Ilya预训练终结!“但Scaling Law还没死”

OpenAI附议Ilya预训练终结!“但Scaling Law还没死”

OpenAI附议Ilya预训练终结!“但Scaling Law还没死”

在Ilya探讨完「预训练即将终结」之后,关于Scaling Law的讨论再次引发热议。

来自主题: AI资讯
6926 点击    2024-12-16 09:48
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法

Scaling Law不仅在放缓,而且不一定总是适用! 尤其在文本分类任务中,扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报
6041 点击    2024-12-16 09:43
Scaling Law百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中

Scaling Law百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中

Scaling Law百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中

什么?Scaling Law最早是百度2017年提的?! Meta研究员翻出经典论文: 大多数人可能不知道,Scaling law原始研究来自2017年的百度,而非三年后(2020年)的OpenAI。

来自主题: AI资讯
5432 点击    2024-11-27 14:20
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力

撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力

撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力

自回归方法,在图像生成中观察到了 Scaling Law。 「Scaling Law 撞墙了?」这恐怕是 AI 社区最近讨论热度最高的话题。

来自主题: AI技术研报
5006 点击    2024-11-26 13:48
做出最好大模型的 CEO,不认为 Scaling Law 撞墙了

做出最好大模型的 CEO,不认为 Scaling Law 撞墙了

做出最好大模型的 CEO,不认为 Scaling Law 撞墙了

Claude 3.5 Sonnet 应该是目前公认综合能力最好的基础模型。

来自主题: AI资讯
8027 点击    2024-11-23 11:19
续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

续命Scaling Law?世界模型GPT-4o让智能体超级规划,OSU华人一作

Scaling Law撞墙,扩展语言智能体的推理时计算实在太难了!破局之道,竟是使用LLM作为世界模型?OSU华人团队发现,使用GPT-4o作为世界模型来支持复杂环境中的规划,潜力巨大。

来自主题: AI技术研报
5569 点击    2024-11-22 13:38